百度智能云助力自动驾驶全链路研发
本文整理自 2022 年 12 月的智算峰会 · 自动驾驶分论坛上的同名主题分享。
此次分享是自动驾驶分论坛的第一个演讲主题,是之前已经发布的三期自动驾驶分论坛演讲的概括性总结,整体介绍了百度智能云的自动驾驶解决方案。
百度智能云通过 AI 大底座、自动驾驶工具链以及基础云底座资源,为自动驾驶提供了软硬件一体的基础平台。
1. 百度在智驾和智舱领域的成果
百度在智能驾驶和智能座舱这两大领域里面都有自己的产品。
在智能驾驶方面,百度的 Apollo 目前是国内做得最好的 L4 级别的自动驾驶产品,在北京亦庄、上海嘉定均有萝卜快跑在运营。此外,百度的城市辅助领航驾驶(ANP)、自主泊车解决方案(AVP)、高精地图、车规级硬件产品都在很多合作车厂量产落地。
在智能座舱领域,百度也跟很多车厂进行了合作。百度目前有 70 多家合作车企,800 多个合作车型,已经实现了 2000 万+的智能驾驶和智能座舱能力的搭载。
2. 从自动驾驶感知算法看自动驾驶对云计算的需求
自动驾驶的开发对云计算和 AI 技术都有非常强的依赖性。在下面这张图中,我们整理了做自动驾驶感知算法对云计算技术的需求。
从下图我们可以看出,如果做 L2、L3 级别的 Demo,我们只需要百万级的图片和几张卡的训练即可实现。由于数据量很小同时使用范围有限,从合规的角度来讲,要求也不是很高,几百万的费用就可以实现这样的一个简单的 Demo。但是如果要做 L2、L3 级别的量产,投入的资金就上了一个量级,可能就要到几千万,而这仅仅是在感知算法的数据和计算平台相关方面的投入。
而到了 L4 的时候,即使是感知算法的 Demo,它需要存储的数据量也超过了 1 PB,同时需要上百张 GPU 训练卡,相关的投资规模达到 0.5 亿 - 2 亿级别。而如果要实现 L4 级别的量产车迭代,相关的投入就是更是超过了 5 亿,所需的数据量也会达到几十个 PB。在这个过程中,整个数据闭环的运转过程需要 24 小时以内完成。只有这样,我们前一天在路上碰到的某个场景,第二天它才能够成为场景库的一部分,帮助企业能够进行持续的测试。这样才能够真正地支持 Level 4 持续的开发和量产。
而在数据闭环的研发能力上,通过专业采集得到的数据经过脱敏和标注后,进入到训练平台进行训练,得到相应的模型。模型持续优化迭代之后,会经过嵌入平台移植到量产车中。
最后,我们再通过汽车的影子模式把某些我们感兴趣的场景的数据采集再上传回来,这样就可以用量产车来帮助我们进行数据采集。虽然它单车采集的数据量没有专业采集那么大,但从整体来讲,它会帮助我们获得更加丰富的场景数据。
我们可以看到整个数据闭环的流程、数据闭环的数据量规模、使用的 GPU 资源规模都是非常大的。如此大规模的数据处理和训练需要很强的云计算资源的支持。
3. 自动驾驶解决方案全景图
这是我们的自动驾驶解决方案的全景图。可以看到处于最中间的是我们用于数据使用处理的百舸平台和 AI 中台,即 AI 大底座。AI 大底座可以部署在百度智能云的公有云、私有云、或者客户的专属云上面。
在这个 AI 大底座上我们部署自动驾驶的采集、标注、数据闭环、自动驾驶、云仿真和运营服务等工具链体系,这些工具链体系再来支持自动驾驶开发的各个场景,包括研发迭代、数据回传、能力评估、驾驶仿真等等,这样就形成了对整个自动驾驶业务从 AI 大底座、工具链到场景的一个完整的研发支持。
百度的自动驾驶的工具链可以说是业界最强的,我们提供了从数据采集、数据合规、数据标注、数据管理、训练&仿真等自动驾驶核心能力的数据运营服务和工具链平台,可以方便地定义各种数据、筛选、处理的算子,也支持用户自定义算子。
通过这种方式,我们可以很快找到和筛选出来对算法改进最有用的数据。同时还可以通过这些数据挖掘出在 L4 训练以及测试过程中所没有遇到过的场景,然后在 24 小时内将该场景输入到我们的仿真平台中,成为我们场景库的一部分。
4. 自动驾驶的弹性策略
对于很多企业来说,投资如此大而完整的平台所需要的费用是非常大的。也正因此,我们设计了如下的弹性策略以满足不同类型企业的不同需求。
在下图中我们可以看到,从整个自动驾驶的开发过程来讲,百度提供了大部分的能力(灰色部分)。也正因此,我们可以为不同的企业做提供不同的定制服务。举例来说,对于一般的 Tier1 、Tier2 ,对重资产的投入是比较谨慎的。对于这样的客户,百度智能云可以通过合规云的机制来提供重资产能力。而轻资产部分,可以是百度智能云投入研发来支持,也可以是我们的 Tier2 客户来做。这样就比较适合资金、规模都比较小的 Tier2 企业,仅投入几百万就可以串联起一个小型的数据闭环。
对于资金比较雄厚的 OEM 来说,它可以选择和百度智能云合作的方式来进行重资产投入(图中深灰色部分)。这也就意味着该部分资源的费用由 OEM,也就是我们的客户来提供,百度智能云则提供对应的技术支持。这部分落地的产物一般为 OEM 客户的私有云,或者部分私有云,部分通过百度智能云的公有云机制/合规服务机制来提供。
5. 自动驾驶工具链一览
下图是我们的自动驾驶的工具链。我们可以看到 2020 年、2021 年百度均在自动驾驶能力排行的第一阵营,这里还有 Tesla、Cruise、Argo AI、Waymo 等公司。在这些公司里面只有百度把自己的工具链提供给其他的客户使用。我们是以一种开放的心态来去做这样的事情,因为当越来越多的人来使用,实际上就在为整个行业的快速发展提供助力。
百度的自动驾驶工具链里面包括几大平台:数据平台、标注平台、研发平台和仿真平台。
数据平台主要针对采集来的海量数据进行数据清洗和数据处理,同时对原始数据进行场景挖掘,方便后面去做场景库的转化。
标注平台主要分为标注项目管理和标注工具的管理两大部分,帮助我们对标注过程的不同角色和不同环节做高效的项目管理,以及提供更快速准确的标注服务。
研发平台主要解决大规模的模型训练和管理的能力,帮助客户构建有效的训练集,提升模型指标与调优模型。
仿真平台里,包含了我们刚才说的大规模并行仿真,可以在云上动态开启资源,在很短的时间内完成几千上万的场景仿真测试。当我们的场景库积累越多,仿真测试的覆盖面也就越来越广。